Основы классификации (объектов)
Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 9 классы | Планирование уроков на учебный год | Основы классификации (объектов
Изучив эту тему, вы узнаете:
— что такое классы и подклассы;
— что такое основание для классификации;
— что такое наследование свойств;
— для чего нужна классификация;
— как проводить классификацию разнообразных объектов;
— как классифицируются компьютерные документы.
Классы и классификация
Человеку присуща способность обобщать и упорядочивать все многообразие объектов. Каждое имя существительное отражает представление человека об обширной группе объектов: дом, стол, книга. Объекты одной группы обладают общими для всей группы характеристиками, а также некоторыми чертами, позволяющими отличить их от других объектов.
Человеку свойственно отождествлять несколько объектов, родственных по какому-то признаку, рассматривая их как самостоятельный объект.
Например, про скрипку, виолончель, альт, контрабас, флейту, гобой, фагот, трубу мы говорим, что это «музыкальные инструменты». Видя на столе чашки, блюдца, сахарницу, чайник, называем это общим словом «посуда». У этих групп объектов существуют некоторые общие свойства, на них можно одинаково воздействовать для получения определенного результата. Обычно они существуют в одной среде. Такие группы объектов получили название «класс».
Класс — группа объектов с одинаковым набором характеристик.
Объекты, входящие в класс, называются экземплярами класса. Необходимо понять, что объекты, которые вы по каким-то параметрам объединили в класс с общим названием, отличаются друг от друга конкретными значениями параметров. Например, мячи, сохраняя основные свойства данного класса объектов (легкость, упругость), могут различаться материалом (каучуковые, резиновые, кожаные), цветом, размером. Птицами называют орла и курицу, страуса и колибри. Даже внутри узкого класса экземпляры могут сильно различаться: среди крылатых насекомых под названием «пчелы» существует матки, трутни, рабочие пчелы. В этом проявляется важное свойство классов — многообразие экземпляров, входящих в класс. Эти различия позволяют выделять внутри классов более узкие группы — подклассы, то есть проводить классификацию объектов в окружающем мире.
Классификация — распределение объектов на классы и подклассы на основании общих признаков.
Результаты классификации принято отображать в виде иерархической (древовидной) схемы. Общий вид такой схемы изображен на рисунке 9.1.
Внешне схема классификации напоминает перевернутое дерево, за что и получила название иерархической (древовидной). Пунктирными линиями на схеме выделены уровни иерархии. Самый верхний уровень (корень дерева) задает основные признаки, позволяющие отличить объекты данного класса от других. Каждый следующий нижестоящий уровень выделяет из вышестоящего группы объектов на основании совпадения одного или нескольких признаков. На нижнем уровне располагаются конкретные экземпляры выделенных подклассов.
С подобными схемами вы, возможно, уже встречались при изучении биологии, истории и других предметов.
Рис. 9.1. Общий вид иерархической схемы
В виде такой схемы часто изображают родословную. Ее принято называть генеалогическим древом.
Родословная — перечень поколений одного рода, устанавливающий происхождение и степени родства.
Основание классификации
С известными примерами классификации вы уже знакомы. Например, в биологии это классификация растений и животных. С глубокой древности люди, знакомясь с многообразием форм жизни на Земле, стремились распределить это многообразие по группам. Так сложилась естественная классификация, основанная на наблюдении и группировке по некоторым признакам. Идеи, изложенные в книге К. Линнея «Виды растений», изданной в 1753 году, до сих пор служат исходной точкой йри класси- фикации растений. С того времени используется и двойное название растений: первая часть имени указывает на подкласс (семейство), а вторая — на конкретные особенности экземпляра этого подкласса. Например, название Citrus limon указывает, что речь идет о семействе цитрусовых, а конкретно — о лимонном дереве.
Классификации поддаются не только природные, но и искусственные объекты: в грамматике принято разделение слов по частям речи, в физике — классификация видов движения, в математике — классификация чисел. В их основе лежит группировка объектов по одному или нескольким намеренно выбранным признакам. В разных отраслях науки и техники классы и подклассы могут иметь свои специфические названия: виды, семейства, отделы, разряды, группы и т. п. При этом суть их не меняется.
Рассмотрим объект «книга». Под этим словом мы подразумеваем множество разнообразных книг: художественных и технических, разных авторов, разной стоимости, толстых и тонких, в подарочном издании и в мягкой обложке…
А теперь представьте, что вам необходимо разложить все это многообразие «по полочкам» в буквальном смысле слова, например упорядочить свою библиотеку.
Каждый подойдет к этому вопросу по-разному. Один человек расставит все книги в алфавитном порядке, по фамилии автора. Другой разделит их на жанры: детективы, фантастика, приключения, любовные или исторические романы. Третий поместит их на полки, руководствуясь цветом переплета и размером книг (наверняка вы сталкивались и с таким подходом). Несмотря на разницу в способах классификации, все эти примеры роднит нечто общее: подразделение объектов на «родственные» группы (классы), для которых существует один или несколько общих параметров.
Во всех приведенных примерах при группировке был выбран общий признак: в первом случае это автор, во втором — жанр, в третьем — цвет и размер. Именно по этим признакам затем производилось выделение из общей массы тех объектов, у которых его значение совпадает.
Таких общих признаков может быть несколько. Они являются основанием классификации. Выбрав основание, из класса с общим названием «книга» можно выделить подклассы: «книга определенного автора», «книга определенного жанра», «книга определенного размера».
Классификация — творческий процесс, поэтому у каждого человека может получиться своя схема. Один из возможных вариантов выделения подклассов из класса книг показан на рисунке 9.2.
Рис. 9.2. Классификация книг
На первом уровне за основу разбиения книг на две группы выбран признак «вымысел» (да, нет). По этому признаку произошло разделение на художественную и техническую литературу.
На втором уровне признак выделения подклассов можно было бы назвать «форма подачи информации» (художественная проза, поэзия, словари и т. д.).
Третий уровень разбиения можно охарактеризовать признаком «стиль изложения».
Четвертый уровень классификации выделен только для романов, чтобы не загромождать схему. Признаком этого уровня выбран «жанр».
На самом нижнем уровне находятся конкретные экземпляры разнообразных книг.
Наследование свойств
Важнейшим свойством классов является наследование. Это слово вам хорошо знакомо. Дети наследуют от родителей черты характера и внешние признаки. Каждый подкласс, выделяющийся из класса, наследует свойства и действия, присущие этому классу. В приведенном на рисунке 9.2 примере и роман Д. С. Мережковского, и все другие изданные романы, и вся художественная литература вообще — наследуют от класса «книга» общие свойства и действия. Все они напечатаны на бумаге, переплетены и предназначены для чтения.
Из приведенной выше классификации видно, что образовалась иерархическая структура (дерево). Во главе ее класс-пра- родитель — «книга». В самом основании экземпляры подклассов — конкретные книги конкретных авторов.
Такая древовидная структура с общим корнем называется «иерархией наследования». Характеристики и поведение, связанные с экземплярами определенного класса, становятся доступны любому классу, расположенному ниже в иерархическом дереве.
Утверждая, что «книга — источник знаний», вы подразумеваете как все книги вообще, так и конкретную книгу, например «О вкусной и здоровой пище». В этом проявляется наследование.
Для чего же нужна классификация?
□ Классификация позволяет выделить из всего многообразия объектов группы с интересующими исследователя свойствами и сосредоточиться на их изучении.
Предположим, что вы — неопытный огородник, но хотите, используя достижения науки, выращивать на своем участке хорошие урожаи помидоров. Вам незачем штудировать толстый том «Растениеводство», достаточно прочесть книги о семействе пасленовых, а еще лучше — об особенностях выращивания помидоров в вашей местности.
□ Классификация объектов проводится с целью установления наследственных связей между объектами. Свойство наследования позволяет изучать характеристики всех объектов класса, не привязываясь к конкретному экземпляру.
В геологии существует «теория единообразных изменений», которая гласит, что все природные факторы действуют повсюду одинаково. Не надо изучать, как действуют ветры на Уральские горы, так как механизм разрушения гор под воздействием ветров давно исследован, он един для всех случаев. То же относится к землетрясениям, вулканам, наводнениям, селям и т. п.
□ Классификация позволяет систематизировать знания об объектах любой природы и назначения.
Иллюстрацией этого утверждения служит то, что нет ни одной школьной дисциплины, в которой не использовалась бы классификация объектов изучения как средство обобщения информации, получаемой на уроках. Откройте любой учебник и убедитесь в этом.
Примеры классификации различных объектов
Исследуя один и тот же объект с разными целями, можно увидеть его различные грани. Например, врач, описывая конкретного человека, сделает акцент на симптомах возможной болезни.
Психолога заинтересуют черты характера и особенности психики. Социальные службы обратят внимание на возраст, наличие родственников, условия жизни. Поэтому одни и те же объекты можно классифицировать по-разному, выбрав те или иные основания. Вы уже столкнулись в учебнике с примерами различных классификаций. Например, изучая раздел 1, вы классифицируете информацию по разным признакам: по способу восприятия и по форме представления.
На рисунке 9.3 приведен еще один пример классификации информации — по содержанию.
Рис. 9.3. Классификация информации по содержанию
В этой классификации на основании признака «содержание» на первом уровне выделены следующие группы информации:
♦ статистическая — показатели развития производства и общества;
♦ коммерческая — наиболее важные сведения о производственных, торговых и финансовых операциях;
♦ экологическая — сведения о состоянии окружающей среды и влиянии деятельности человека на природу;
♦ политическая — информация о деятельности государственной власти, общественных движений и партий;
♦ другая (демографическая, медицинская и т. д.).
Все выделенные подклассы характеризуются теми же свойствами (ясность, полнота, актуальность и т. п.) и действиями (обмен, хранение, обработка), что и вышестоящий класс «информация».
Приведем еще один пример классификации, касающейся наиболее значимых систем (рисунок 9.4).
В качестве основания для классификации на первом уровне выбрано участие человека в создании системы (естественные и искусственные).
На втором уровне основанием для классификации был выбран признак «сфера жизнедеятельности человека». Здесь выделены такие подклассы систем:
♦ духовные у касающиеся духовной жизни человека;
♦ технологические у связанные с производственной деятельностью человека;
♦ организационные у обеспечивающие обслуживание всех видов деятельности.
Рис. 9.4. Классификация наиболее значимых систем
На схеме не показано дальнейшее разветвление дерева, так как это сделало бы рисунок громоздким. Но подразумевается, что дальнейшее выделение подклассов возможно. Например, рассматривая класс систем, называемых «Искусство», можно было выделить следующие подклассы по средствам воплощения замыслов авторов: Живопись, Скульптура, Архитектура, Литература, Театр, Музыка, Кино и т. д.
Наряду с устоявшимися и общепризнанными классификациями имеет право существовать любая классификация объектов, если за ее основу взят характерный признак и соблюдены правила выделения классов и подклассов. На рисунке 9.5 приведен пример классификации используемых в реальной жизни и встречающихся в сказках средств передвижения.
Здесь на нулевом уровне расположен класс объектов с общим названием «средства передвижения».
На первом уровне выделено два подкласса по признаку «реальность» (существуют в реальной жизни или в сказках, фантазиях).
Рис. 9.5. Классификация средств передвижения
Второй уровень выделяет из реальных и сказочных средств передвижения новые подгруппы по признаку «среда передвижения».
Третий уровень делит реальные средства передвижения на подгруппы по признаку «вид транспортйого средства». На схеме не указано выделение подгрупп из реальных наземных средств передвижения, чтобы не загромождать ее. Но эти группы могли быть следующими: рельсовые, дорожные. Возможно и дальнейшее подразделение. Важно понять, что нижние уровни наследуют все характерные признаки, свойственные более высоким уровням: например, объект Ка-26, принадлежащий к подклассу вертолетов, наследует от вышестоящего уровня среду перемещения (воздух), а также является реальным средством передвижения со всеми сопутствующими признаками (существует в реальной жизни, осуществляет перевозки людей и грузов).
Классификация компьютерных документов
В самом общем смысле компьютер можно назвать инструментом для обработки информации. Для этого существует множество разнообразных программных сред. Разработчики постоянно совершенствуют программы, упрощая работу с ними и предусматривая в них новые возможности.
Чтобы не «утонуть» в море программных продуктов, пользователь очень хорошо должен представлять, с какой информацией ему предстоит работать. Каждая программная среда предназначена для создания документов определенного вида.
На практических занятиях вы уже познакомились со многими видами компьютерных документов, которые будут упоминаться при классификации документов.
Приведенная на рисунке 9.6 схема показывает классификацию, в которой в качестве основания выбран признак «назначение документа». Основным назначением компьютерных документов является представление информации в удобном для пользователя виде. В таблице 9.1 дана более конкретная характеристика каждого класса документов.
Рис. 9.6. Классификация компьютерных документов
Обратите внимание, что название среды, как правило, совпадает с видом документа и формой представленной в нем информации.
Приведенная классификация поможет вам выбрать среду в соответствии с предполагаемой формой представления информации.
В настоящее время документы, используемые в различных областях человеческой деятельности, создаются на компьютере. Рассмотрим примеры документов различного назначения и сферы применения.
Литературное произведение, газетная статья, приказ — примеры текстовых документов.
Рисунки, чертежи, схемы — это графические документы.
Таблица 9.1. Виды компьютерных документов
Бухгалтер на предприятии представляет в табличном виде данные для расчета зарплаты сотрудников. Основная особенность электронных таблиц состоит в том, что они позволяют не только представлять информацию в табличной форме, но и производить автоматические вычисления по формулам, связывающим ячейки таблицы.
Один из видов компьютерных документов — база данных. Она представляет собой совокупность упорядоченных сведений об объектах. В обычной жизни вы не раз встречались с базами данных. Это и картотека с названиями книг в библиотеке, и телефонный справочник, и каталог товаров. В настоящее время вместо обычных «бумажных» баз данных повсеместно создаются компьютерные, представленные документами соответствующего вида. Диспетчер справочной службы имеет в своем распоряжении всеобъемлющую компьютерную базу данных, позволяющую ответить на любой ваш вопрос. Система управления базой данных обеспечивает быстрый поиск интересующей вас информации.
Текст, графика, таблица, база данных — это примеры документов, в которых представлена информация какого-то одного вида.
Однако наиболее часто мы имеем дело с составными документами, в которых информация присутствует в разных формах. Такие документы могут содержать и текст, и формулы, и рисунки, и таблицы, и многое другое. Школьные учебники, журналы, газеты — это хорошо знакомые всем примеры составных документов.
Для создания составных документов используются программные среды, в которых предусмотрена возможность представлять информацию в разных формах.
Развитие программного обеспечения привело к тому, что в настоящее время появились новые виды компьютерных документов. В частности, это презентации и гипертекстовые документы.
Презентация представляет собой совокупность компьютерных слайдов. Специальная программа обеспечивает не только подготовку информации, но и показ ее по заранее созданному сценарию.
Гипертекст — это документ, который содержит так называемые гиперссылки на другие части документа или другие файлы, где содержится дополнительная информация.
Контрольные вопросы и задания
1. Для чего нужно классифицировать объекты?
2. Что лежит в основе любой классификации?
3. Приведите пример классификации объектов по общим свойствам.
4. Приведите пример классификации объектов по общим действиям.
5. Может ли среда существования стать основанием классификации?
6. Произведите классификацию объектов с общим названием «велосипед».
7. Классифицируйте домашнюю посуду по следующим признакам: материал, назначение, долговечность.
8. Предложите несколько вариантов упорядочения (классификации) разнообразных объектов на вашем письменном столе.
9. Назовите основание, по которому в одну группу могли бы попасть следующие объекты:
■ кенгуру, утконос, кролик, броненосец;
■ роза, колесо, футбольные бутсы, кактус;
■ молоко, бензин, кислота, магма.
10. Назовите разнородные объекты окружающего мира, которые вошли бы в одну группу по основанию «одно вещество».
11. Какие классификации используют в вашей школьной среде?
12. Перечислите наиболее распространенные группы компьютерных документов.
13. Приведите примеры классов программных продуктов. Какое можно выбрать для этого основание классификации?
14. Какое основание классификации можно использовать для выделения групп аппаратной части компьютера?
15. Какие вы знаете классы памяти компьютера?
xn—-7sbbfb7a7aej.xn--p1ai
Типы классификаций. Фасетные классификации. Примеры.
Типы классификаций:
Иерархические классификации
Фасетные классификации
Булевы классификации.
Фасетные классификации.
При создании классификации возможна ситуация, при которой деление на классы проводится на основе всех возможных комбинаций атрибутов. Значения, которые может принимать отдельный атрибут, объединяются в ФАСЕТ. Каждый фасет дает разбиение всего универсального класса на подклассы первого уровня, число которых определяется мощностью фасета (количеством разных значений в фасете). Попарные пересечения классов первого уровня, принадлежащих разным фасетным разбиениям, дают множество классов второго уровня; тройные пересечения классов первого уровня дают множество классов третьего уровня и т.д. Количество уровней классификации совпадает с количеством классификационных атрибутов, но каждый отдельный класс при этом может быть взаимосвязан с двумя и более классами верхнего уровня. Классификации, построенные по такому принципу, называются фасетными или комбинированными.
Фасетная классификационная структура, построенная для упорядоченного множества атрибутов {A, B, C} со значениями A = {V¹А, V²А, V³А}, B = {V¹B, V²B, V³B}, C = {V¹C, V²C}, представлена в виде
В основе построения фасетных классификаций лежит фасетный анализ.
Сущность фасетного анализа состоит:
в выделении в рассматриваемой ПрО атрибутов классификации;
в описании значений этих атрибутов множеством терминов.
Атрибуты называются фасетами, а отдельный термин фасета – фокусом.
Фасетная классификация пользуется не только готовыми классами. Названия классов строятся на базе разных сочетаний фокусов фасетной формулы, при этом ненужные фасеты пропускаются.
Таким образом, Фасетные классификации значительно облегчают многоаспектное описание документов.
Пример: «Преподаватели института» с помощью совокупности фасетов:
«факультет»
V¹А Экономический факультет
V²А Факультет управления
V³А Юридический факультет
«возраст»
V¹B до 40
V²B 40 — 55
V³B старше 55
«ученая степень»
V¹с имеет
V²С не имеет
Если расположить термины первого фасета на одной горизонтали, а затем приписать к каждому из этих терминов поочередно все термины второго фасета и после этого повторить описанную процедуруц, используя термины третьего фасета, то получится иерархическая классификация. Таким образом, число всех возможных классов фасетной классификации не меньше числа иерархий, которые можно построить для эквивалентонной ей иерархической классификации. Однако в такой классификации можно построить классы «Преподаватели института, имеющие ученую степень», «Преподаватели в возрасте до 40 лет» и т.п.
Сравнительная характеристика иерархических и фасетных классификаций.
В любой иерархической классификации отдельные науки раз и навсегда разорваны разветвлениями жесткого классификационного дерева. Особенно трудно включать в иерархическую классификацию новые межотраслевые предметы и области исследований. требуется периодическое изменение общей структуры той или иной реальной иерархической классификации, новый вариант иерархической классификации устаревает раньше, чем удается завершить работу по переклассифицированию документов. Поэтому выбирается путь соответствующей модификации уже существующих таблиц иерархической классификации, что придает ей все более условный характер.
Критерий, определяющий число возможных группировок для N классификационных атрибутов, характеризует количество подмножеств атрибутов, которые могут быть использованы для формирования класса. В случае иерархической классификации с зафиксированной последовательностью атрибутов значение критерия равно числу уровней классификационного дерева, а в случае фасетной классификации — сумме сочетаний из N атрибутов по одному, двум, трем и так далее до N.
Критерии | Иерархическая | Фасетная |
Структура | Жесткая, задается фиксированной последовательностью классификационных признаков | Учитывает все многообразие сочетаний классификационных признаков |
Механизм построения | Простой, строго фиксированный | Сложный |
Число возможных группировок для N классификационных атрибутов | N (для зафиксированной последовательности классификационных атрибутов) | N i Σ С N i=1 |
Возможность группировать объекты по заранее не предусмотренным сочетаниям признаков | Отсутствует | Присутствует |
Внесение изменений | Жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки | Возможна простая модификация всей системы классификации без изменения структуры существующих группировок |
Многоаспектное описание документов | Невозможно | Возможно |
Информационный поиск по любому сочетанию атрибутов | Не предусмотрен | Предусмотрен |
Механизм пересмотра классификации (изменение состава атрибутов, добавление новых значений) | Требует перестройки всей классификации | Требует добавления новых классов (ранее построенные классы не меняются) |
Пригодность для каталогов и указателей, имеющих любую физическую форму | Пригодна | Непригодна |
Расход квалифицированного труда | Не требует применения высококвалифицированного труда | Требует применения высококвалифицированного труда |
studfiles.net
3. Классификация
Классификация
Классификация — средство упорядочения знаний. В объектно-ориентированном анализе определение общих свойств объектов помогает найти общие ключевые абстракции и механизмы, что в свою очередь приводит нас к более простой архитектуре системы. К сожалению, пока не разработаны строгие методы классификации и нет правила, позволяющего выделять классы и объекты. Нет таких понятий, как «совершенная структура классов», «правильный выбор объектов». Как и во многих технических дисциплинах, выбор классов является компромиссным решением.
Определение классов и объектов — одна из самых сложных задач объектно-ориентированного проектирования. Опыт показывает, что эта работа обычно содержит в себе элементы открытия и изобретения.
С помощью открытий мы распознаем ключевые понятия и механизмы, которые образуют словарь предметной области.
С помощью изобретения мы конструируем обобщенные понятия, а также новые механизмы, которые определяют правила взаимодействия объектов. Поэтому открытие и изобретение — неотъемлемые части успешной классификации.
Целью классификации является нахождение общих свойств объектов. Классифицируя, мы объединяем в одну группу объекты, имеющие одинаковое строение или одинаковое поведение.
Разумная классификация — часть любой науки.
Классификация затрагивает многие аспекты объектно-ориентированного проектирования. Она помогает определить иерархии обобщения, специализации и агрегации. Найдя общие формы взаимодействия объектов, мы вводим механизмы, которые станут фундаментом реализации нашего проекта. Классификация помогает правильно определить модульную структуру. Мы можем расположить объекты в одном или разных модулях, в зависимости от степени схожести объектов; зацепление и связность — всего лишь меры этой схожести.
Трудности классификации
Мы определили объект как нечто, имеющее четкие границы. На самом деле это не вполне так. Границы предметов часто неопределенны. Например, посмотрите на вашу ногу. Попытайтесь определить, где начинается и кончается колено. В разговорной речи трудно понять, почему именно эти звуки определяют слово, а не являются частью какого-то более длинного слова. Представьте себе, что вы проектируете текстовый редактор. Что считать классом — буквы или слова? Как понимать отдельные фразы, предложения, параграфы, документы? Как обращаться с произвольными, не обязательно осмысленными, блоками текста? Что делать с предложениями, абзацами и целыми документами — соответствуют ли такие классы нашей задаче?
Рассмотрим примеры классификации в двух других научных дисциплинах: биологии и химии.
Вплоть до 18-го века идея о возможности классификации живых организмов по степени сложности была господствующей. Мера сложности была субъективной, поэтому неудивительно, что человек оказался в списке на первом месте. В середине XVIII века шведский ботаник Карл Линней предложил более подробную таксономию для классификации организмов: он ввел понятия рода и вида. Век спустя Дарвин выдвинул теорию, по которой механизмом эволюции является естественный отбор и ныне существующие виды животных — продукт эволюции древних организмов. Теория Дарвина основывалась на разумной классификации видов. Как утверждает Дарвин, «натуралисты пытаются расположить виды, роды, семейства в каждом классе в то, что называется натуральной системой. Что подразумевается под этой системой? Некоторые авторы понимают некоторую простую схему, позволяющую расположить наиболее похожие живые организмы в один класс и различные — в разные классы» [4]. В современной биологии термин «классификация» обозначает «установление иерархической системы категорий на основе предположительно существующих естественных связей между организмами» [5]. Наиболее общее понятие в биологической таксономии — царство, затем, в порядке убывания общности: тип (отдел), класс, отряд (порядок), семейство, род и, наконец, вид. Исторически сложилось так, что место каждого организма в иерархической системе определяется на основании внешнего и внутреннего строения тела и эволюционных связей. В современной классификации живых существ выделяются группы организмов, имеющих общую генетическую историю, то есть организмы, имеющие сходные ДНК, включаются в одну группу. Классификация по ДНК полезна, чтобы различить организмы, которые похожи внешне, но генетически сильно отличаются. По современным воззрениям дельфины ближе к коровам, чем к форели. Возможно, для программиста биология представляется зрелой, вполне сформировавшейся наукой с определенными критериями классификации организмов. Но это не так. Биолог Мэй сказал: «На сегодняшний день мы даже не знаем порядок числа видов растений и животных, населяющих нашу планету: классифицировано менее, чем 2 млн. видов, в то время как возможное число видов оценивается от 5 до 50 млн.» [7]. Более того, различные критерии классификации одних и тех же животных приводят к разным результатам. Мартин утверждает, что «все зависит от того, что вы хотите получить. Если вы хотите, чтобы классификация говорила о кровном родстве видов, вы получите один ответ, если вы желаете отразить уровень приспособления, ответ будет другой» [8]. Можно заключить, что даже в строгих научных дисциплинах методы и критерии классификации сильно зависят от цели классификации.
Аналогичная ситуация сложилась и в химии [9]. В древние времена считалось, что все вещества суть комбинации земли, воздуха, огня и воды. В настоящее время такая классификация не может считаться сколько-нибудь удовлетворительной. В середине XVII в. Роберт Бойль предложил элементы как примитивные химические абстракции, из которых составляются более сложные вещества. Век спустя, в 1789 г., Лавуазье опубликовал первый список, содержащий 23 элемента, хотя впоследствии было открыто, что некоторые из них таковыми не являются. Но открытие новых элементов продолжалось, список увеличивался. Наконец, в 1869 г. Менделеев предложил периодический закон, который давал точные критерии для классификации известных элементов и даже мог предсказывать свойства еще не открытых элементов. Но даже периодический закон не был концом истории о классификации элементов. В начале XX в. были открыты элементы с одинаковыми химическими свойствами, но с разными атомными весами — изотопы.
Вывод прост. Как утверждал Декарт: «Открытие порядка — нелегкая задача, но если он найден, понять его совсем не трудно». Лучшие программистские решения выглядят просто, но, как показывает опыт, добиться простой архитектуры очень трудно.
Итеративная суть классификации.
Все эти сведения я привел не для того, чтобы оправдать «долгострой» в программном обеспечении. Я просто хочу подчеркнуть, что разумная классификация — работа интеллектуальная и лучший способ ее ведения — последовательный, итеративный процесс.
Шоу утверждает, что в разработке программного обеспечения «развитие какой-либо абстракции часто следует общей схеме. В начале проблема решается ad hoc, то есть как-нибудь, для каждого частного случая. По мере накопления опыта некоторые решения оказываются более удачными, чем другие, и возникает род фольклора, переходящего от человека к человеку. Удачные решения изучаются более систематически, они программируются и анализируются. Это позволяет развить модели, осуществить их автоматическую реализацию, и разработать теорию, обобщающую найденное решение. Это в свою очередь поднимает практику на более высокий уровень и позволяет взяться за еще более сложную задачу, к которой, в свою очередь, мы подходим ad hoc, тем самым начиная новый виток спирали«
Итеративный подход к классификации накладывает соответствующий отпечаток и на процедуру конструирования иерархии классов и объектов при разработке сложного программного обеспечения. На практике обычно за основу берется какая-то определенная структура классов, которую постепенно совершенствуют. И только на поздней стадии разработки, когда уже получен некоторый опыт использования такой структуры, мы можем критически оценить качество получившейся классификации.
Основываясь на полученном опыте, мы можем создать новый подкласс из уже существующих (вывод), или разделить большой класс на много маленьких (факторизация), или, наконец, слить несколько существующих в один (композиция). Возможно, в процессе разработки будут найдены новые общие свойства, ранее не замеченные, и мы сможем определить новые классы (абстракция).
Почему же классификация так сложна?
Мы объясняем это двумя причинами.
Во-первых, отсутствием «совершенной» классификации, хотя, естественно, одни классификации лучше других. Cуществует столько способов деления мира на объектные системы, сколько ученых принимается за эту задачу. Любая классификация зависит от точки зрения субъекта.
Во-вторых, разумная классификация требует изрядной доли творческого озарения.
Иногда ответ очевиден, иногда он — дело вкуса, а бывает, что все зависит от умения заметить главное. Это напоминает загадку: «Почему лазерный луч похож на золотую рыбку?.. Потому, что ни тот, ни другой не умеют свистеть». Надо быть очень творческим мыслителем, чтобы найти общее в настолько несвязанных предметах.
Идентификация классов и объектов
Классический и современный подходы
Исторически известны три подхода к классификации:
классическая категоризация;
концептуальная кластеризация;
теория прототипов.
Классическая категоризация.
«все вещи, обладающие данным свойством или совокупностью свойств, формируют некоторую категорию. Причем наличие этих свойств является необходимым и достаточным условием, определяющим категорию». Например, холостые люди — это категория: каждый человек или холост, или женат, и этот признак достаточен для решения вопроса, к какой категории принадлежит тот или иной индивидуум. С другой стороны, высокие люди не определяют категории, если, конечно, мы специально не уточним критерий, позволяющий четко отличать высоких людей от невысоких.
Классическая категоризация пришла к нам от Платона и Аристотеля. Последний в своей классификации растений и животных пользовался техникой рассуждений, напоминающей современную детскую игру в 20 вопросов (Это минерал, животное или растение? Это покрыто мехом или перьями? Может ли оно летать? Пахнет ли оно?)
Такой подход нашел последователей, наиболее выдающимися из которых были: Фома Аквинский, Декарт, Локк. По утверждению Фомы Аквинского: «Мы можем именовать вещи согласно нашим знаниям об их природе, получаемым через познание их свойств и действий».
Таким образом, классический подход в качестве критерия похожести объектов использует родственность их свойств. В частности, объекты можно разбивать на непересекающиеся множества в зависимости от наличия или отсутствия некоторого признака.
Предполагается, что лучшими являются такие наборы свойств, элементы которых мало взаимодействуют между собой. Этим объясняется всеобщая любовь к таким критериям как размер, цвет, форма и материал. Так как эти критерии не пересекаются, про какой-нибудь предмет можно утверждать, что он большой, серый, круглый и деревянный». Вообще говоря, свойства не обязательно должны быть измеряемыми, в качестве их можно использовать наблюдаемое поведение. То обстоятельство, что птицы летают, а рыбы нет, позволяет отличить орла от форели.
Какие конкретно свойства надо принимать во внимание? Это зависит от обстановки. Например, цвет автомобиля надо зафиксировать в задаче учета продукции автомобилестроительного завода, но он не интересен программе, управляющей уличным светофором. Вот почему мы говорим, что нет абсолютного критерия классификации, одна и та же структура классов может подходить для одной задачи и не годиться для другой.
Джеймс: «Нельзя утверждать, что некоторая схема классификации лучше других отражает структуру и порядок вещей в природе. Природе безразличны наши попытки в ней разобраться. Некоторые классификации действительно важнее других, но только в связи с нашими интересами, а не потому, что они вернее или полнее отражают реальность»
Современное западное мышление по большей части насквозь пропитано классической категоризацией, однако, как показывает пример с высокими и низкими людьми, этот подход не всегда работает.
«Естественные категории не четко отграничены друг от друга. Большинство птиц летает, но не все. Стул может быть деревянным, металлическим или пластмассовым, а количество ног у него целиком зависит от прихоти конструктора. Практически невозможно перечислить определяющие свойства естественной категории, так, чтобы не было исключений».
Это, действительно, коренные пороки классической категоризации, которые и попытались исправить в современных подходах. Ими мы сейчас займемся.
Концептуальная кластеризация.
Это более современный вариант классического подхода. Он возник из попыток формального представления знаний.
«При таком подходе сначала формируются концептуальные описания классов (кластеров объектов), а затем мы классифицируем сущности в соответствии с этими описаниями».
Например, возьмем понятие «любовная песня». Это именно понятие, а не признак или свойство, поскольку степень любовности песни едва ли можно измерить. Но если можно утверждать, что песня скорее про любовь, чем про что-то другое, то мы помещаем ее в эту категорию.
Концептуальную кластеризацию можно связать с теорией нечетких (многозначных) множеств, в которой объект может принадлежать к нескольким категориям одновременно с разной степенью точности. Концептуальная кластеризация делает в классификации абсолютные суждения, основываясь на наилучшем согласии.
Теория прототипов.
Классическая категоризация и концептуальная кластеризация — достаточно выразительные методы, вполне пригодные для проектирования сложных программных систем. Но все же есть ситуации, в которых эти методы не работают.
Существуют некоторые абстракции, которые не имеют ни четких свойств, ни четкого определения.
Книга по психологии восприятия: «Существуют категории (например, игры), которые не соответствуют классически образцам, так как нет признаков, свойственных всем играм… По этой причине их можно объединить так называемой семейной схожестью… Виттгенстейн утверждает, что у категории игр нет четкой границы. Категорию можно расширить и включить новые виды игр при условии, что они напоминают уже известные игры».
Вот почему этот подход называется теорией прототипов: класс определяется одним объектом-прототипом, и новый объект можно отнести к классу при условии, что он наделен существенным сходством с прототипом.
Вернемся к проблеме стульев. Мы считаем мягкий пуф, парикмахерское кресло и складной стул стульями не потому, что они удовлетворяют некоторому фиксированному набору признаков прототипа, но потому, что они имеют достаточное фамильное сходство с прототипом… Не требуется никакого общего набора свойств прототипа, которое годилось бы и для пуфика и для парикмахерского кресла, но они оба — стулья, так как каждый из них в отдельности похож на прототипный стул, пусть даже каждый по-своему.
Свойства, определяемые при взаимодействии с объектом (свойства взаимодействия), являются главными при определении семейного сходства»
Понятие свойств взаимодействия — центральное для теории прототипов. В концептуальной кластеризации мы группируем в соответствии с различными концепциями. В теории прототипов классификация объектов производится по степени их сходства с конкретным прототипом.
Применение классических и новых теорий.
Три рассмотренных подхода к классификации имеют непосредственное отношение к объектно-ориентированному проектированию.
На практике мы идентифицируем классы и объекты сначала по свойствам, важным в данной ситуации, то есть стараемся выделить и отобрать структуры и типы поведения с помощью словаря предметной области. Если таким путем не удалось построить удобоваримой структуры классов, мы пробуем концептуальный подход. В этом случае в центре внимания уделяется поведение объектов, когда они взаимодействуют друг с другом. Наконец, мы пробуем выделить прототипы и ассоциировать с ними объекты.
Объектно-ориентированный анализ
Границы между стадиями анализа и проектирования размыты, но решаемые ими задачи определяются достаточно четко.
В процессе анализа мы моделируем проблему, обнаруживая классы и объекты, которые составляют словарь проблемной области.
При объектно-ориентированном проектировании мы изобретаем абстракции и механизмы, обеспечивающие поведение, требуемое моделью.
Классические подходы (опираются на классическую категоризацию)
∙ Осязаемые предметы | Автомобили, телеметрические данные, датчики давления |
∙ Роли | Мать, учитель, политик |
∙ События | Посадка, прерывание, запрос |
∙ Взаимодействие | Заем, встреча, пересечение |
∙ Структуры | Отношения «целое-часть» и «общее-частное» |
∙ Другие системы | Внешние системы, с которыми взаимодействует приложение |
∙ Устройства | Устройства, с которыми взаимодействует приложение |
∙ События | Происшествия, которые должны быть запомнены |
∙ Разыгрываемые роли | Роли, которые исполняют пользователи, работающие с приложением |
∙ Места | Здания, офисы и другие места, существенные для работы приложения |
∙ Организационные единицы | Группы, к которым принадлежат пользователи |
Анализ поведения. В то время как классические подходы концентрируют внимание на осязаемых элементах предметной области, другая школа мысли объектно-ориентированного анализа сосредотачивается на динамическом поведении как на первоисточнике объектов и классов. Это напоминает концептуальную кластеризацию, рассмотренную выше: мы формируем классы, основываясь на группах объектов, демонстрирующих сходное поведение.
Ответственности объекта следует понимать «его знания и умения».
Ответственность — это способ выразить цель объекта и его место в системе.
Ответственность объекта есть совокупность всех услуг, которые он может предоставлять по всем его контрактам.
То есть, мы объединяем вместе те объекты, которые имеют сходные ответственности и строим иерархию классов, в которой каждый подкласс, выполняя обязательства суперкласса, привносит свои дополнительные услуги.
Анализ предметной области.
Мы определим такой анализ как «попытку выделить те объекты, операции и связи, которые эксперты данной области считают наиболее важными». Анализ предметнойобласти полезно разбить на этапы:
Построение скелетной модели предметной области при консультациях с экспертами в этой области.
Изучение существующих в данной области систем и представление результатов в стандартном виде.
Определение сходства и различий между системами при участии экспертов.
Уточнение общей модели для приспособления к нуждам конкретной системы.
Пример: система бухгалтерского учета должна представлять различные виды отчетов. Если считать отчеты некой предметной областью, ее анализ может привести разработчика к пониманию ключевых абстракций и механизмов, которые обслуживают все виды отчетов. Полученные таким образом классы и объекты представляют собой множество ключевых абстракций и механизмов, отобранных с учетом цели исходной задачи: создания системы отчетов. Поэтому окончательный проект будет проще.
Определим теперь, кто такой эксперт? В роли эксперта часто выступает просто пользователь системы, например, инженер или диспетчер. Он не обязательно должен быть программистом, но должен быть близко знаком с исследуемой проблемой и разговаривать на языке этой проблемы.
[Анализ варинатов]
К сожалению по отдельности классический подход, поведенческий подход и изучение предметной области, рассмотренные выше, сильно зависят от индивидуальных способностей и опыта аналитика. Для большинства реальных проектов одновременное применение всех трех подходов неприемлемо, так как процесс анализа становится недетерминированным и непредсказуемым.
Анализ вариантов — это подход, который можно успешно сочетать с первыми тремя, делая их применение более упорядоченным. Впервые его формализовал Джекобсон, определивший вариант применения, как «частный пример или образец использования, сценарий, начинающийся с того, что пользователь системы инициирует операцию или последовательность взаимосвязанных событий»
Коротко говоря, этот вид анализа можно начинать вместе с анализом требований. В этот момент пользователи, эксперты и разработчики перечисляют сценарии, наиболее существенные для работы системы (пока не углубляясь в детали). Затем они тщательно прорабатывают сценарии, раскладывая их по кадрам, как делают телевизионщики и кинематографисты
При этом они устанавливают, какие объекты участвуют в сценарии, каковы обязанности каждого объекта и как они взаимодействуют в терминах операций. Тем самым группа разработчиков вынуждена четко распределить области влияния абстракций.
Далее набор сценариев расширяется, чтобы учесть исключительные ситуации и вторичное поведение. В результате появляются новые или уточняются существующие абстракции.
CRC-карточки. CRC обозначает Class-Responsibilities-Collaborators (Класс/Ответственности/Участники). Это простой и замечательно эффективный способ анализа сценариев. Карты CRC впервые предложили Бек и Каннингхэм для обучения объектно-ориентированному программированию, но такие карточки оказались отличным инструментом для мозговых атак и общения разработчиков между собой.
На карточках вы пишите (обязательно карандашом) сверху — название класса, снизу в левой половине — за что он отвечает, а в правой половине — с кем он сотрудничает.
Карточки можно раскладывать так, чтобы представить формы сотрудничества объектов. С точки зрения динамики сценария, их расположение может показать поток сообщений между объектами, с точки зрения статики они представляют иерархии классов.
Неформальное описание. Радикальная альтернатива классическому анализу была предложена в чрезвычайно простом методе Аббота. Согласно этому методу надо описать задачу или ее часть на простом английском языке, а потом подчеркнуть существительные и глаголы. Существительные — кандидаты на роль классов, а глаголы могут стать именами операций.
Подход Аббота полезен, так как он прост и заставляет разработчика заниматься словарем предметной области. Однако он весьма приблизителен и непригоден для сколько-нибудь сложных проблем. Человеческий язык — ужасно неточное средство выражения, потому список объектов и операций зависит от умения разработчика записывать свои мысли. Тем более, что для многих существительных можно найти соответствующую глагольную форму и наоборот.
Ключевые абстракции и механизмы
Ключевые абстракции
Поиск и выбор ключевых абстракций.Ключевая абстракция — это класс или объект, который входит в словарь проблемной области.
Самая главная ценность ключевых абстракций заключена в том, что они определяют границы нашей проблемы: выделяют то, что входит в нашу систему и поэтому важно для нас, и устраняют лишнее. Задача выделения таких абстракций специфична для проблемной области. Как утверждает Голдберг, «правильный выбор объектов зависит от назначения приложения и степени детальности обрабатываемой информации».
Как мы уже отмечали, определение ключевых абстракций включает в себя два процесса: открытие и изобретение. Мы открываем абстракции, слушая специалистов по предметной области: если эксперт про нее говорит, то эта абстракция обычно действительно важна. Изобретая, мы создаем новые классы и объекты, не обязательно являющиеся частью предметной области, но полезные при проектировании или реализации системы.
Например, пользователь банкомата говорит «счет, снять, положить»; эти термины — часть словаря предметной области. Разработчик системы использует их, но добавляет свои, такие, как база данных, диспетчер экрана, список, очередь и так далее. Эти ключевые абстракции созданы уже не предметной областью, а проектированием.
Уточнение ключевых абстракций. Определив кандидатов на роли ключевых абстракций, мы должны оценить их по критериям, описанным в предыдущих главах. По словам Страуструпа «программист должен задаваться вопросами: Как создаются объекты класса? Как можно копировать и/или уничтожать объекты данного класса? Какие операции могут быть выполнены над этим объектом? Если ответы на эти вопросы туманны, то, возможно, общая концепция не ясна и лучше сесть и подумать еще раз, чем бросаться программировать»
Определив новые абстракции, мы должны найти их место в контексте уже существующих классов и объектов. Не стоит пытаться делать это строго сверху вниз или снизу вверх. Нет особой необходимости строить иерархию классов, начиная с самого верхнего класса, и потом дополнять ее подклассами. Чаще вы создаете несколько независимых иерархий, осознаете их общие черты и выделяете один или несколько суперклассов. Требуется несколько проходов вверх и вниз по иерархии, чтобы создать программный проект». Это не карт-бланш на хакерство, а всего лишь наблюдение, основанное на опыте и подтверждающее тот факт, что объектно-ориентированное проектирование — процесс последовательных приближений.
Трудно сразу расположить классы и объекты на правильных уровнях абстракции. Иногда, найдя важный класс, мы можем передвинуть его вверх в иерархии классов, тем самым увеличивая степень повторности использования кода. Это называется продвижением класса. Аналогично, можем прийти к выводу, что класс слишком обобщен, и это затрудняет наследование: происходит семантический разрыв или конфликт зернистости. В обоих случаях мы пытаемся выявить зацепление или недостаточную связность абстракций и смягчить конфликт.
studfiles.net
47. Типы классификаций. Фасетные классификации. Примеры.
Типы классификаций:
Иерархические классификации
Фасетные классификации
Булевы классификации.
Фасетные классификации.
При создании классификации возможна ситуация, при которой деление на классы проводится на основе всех возможных комбинаций атрибутов. Значения, которые может принимать отдельный атрибут, объединяются в ФАСЕТ. Каждый фасет дает разбиение всего универсального класса на подклассы первого уровня, число которых определяется мощностью фасета (количеством разных значений в фасете). Попарные пересечения классов первого уровня, принадлежащих разным фасетным разбиениям, дают множество классов второго уровня; тройные пересечения классов первого уровня дают множество классов третьего уровня и т.д. Количество уровней классификации совпадает с количеством классификационных атрибутов, но каждый отдельный класс при этом может быть взаимосвязан с двумя и более классами верхнего уровня. Классификации, построенные по такому принципу, называются фасетными или комбинированными.
Фасетная классификационная структура, построенная для упорядоченного множества атрибутов {A, B, C} со значениямиA= {V¹А, V²А, V³А},B= {V¹B, V²B, V³B},C= {V¹C, V²C}, представлена в виде
В основе построения фасетных классификаций лежит фасетный анализ.
Сущность фасетного анализа состоит:
в выделении в рассматриваемой ПрО атрибутов классификации;
в описании значений этих атрибутов множеством терминов.
Атрибуты называются фасетами, а отдельный термин фасета – фокусом.
Фасетная классификация пользуется не только готовыми классами. Названия классов строятся на базе разных сочетаний фокусов фасетной формулы, при этом ненужные фасеты пропускаются.
Таким образом, Фасетные классификации значительно облегчают многоаспектное описание документов.
Пример: «Преподаватели института» с помощью совокупности фасетов:
«факультет»
V¹А Экономический факультет
V²А Факультет управления
V³А Юридический факультет
«возраст»
V¹B до 40
V²B 40 — 55
V³B старше 55
«ученая степень»
V¹с имеет
V²С не имеет
Если расположить термины первого фасета на одной горизонтали, а затем приписать к каждому из этих терминов поочередно все термины второго фасета и после этого повторить описанную процедуруц, используя термины третьего фасета, то получится иерархическая классификация. Таким образом, число всех возможных классов фасетной классификации не меньше числа иерархий, которые можно построить для эквивалентонной ей иерархической классификации. Однако в такой классификации можно построить классы «Преподаватели института, имеющие ученую степень», «Преподаватели в возрасте до 40 лет» и т.п.
48. Сравнительная характеристика иерархических и фасетных классификаций.
В любой иерархической классификации отдельные науки раз и навсегда разорваны разветвлениями жесткого классификационного дерева. Особенно трудно включать в иерархическую классификацию новые межотраслевые предметы и области исследований. требуется периодическое изменение общей структуры той или иной реальной иерархической классификации, новый вариант иерархической классификации устаревает раньше, чем удается завершить работу по переклассифицированию документов. Поэтому выбирается путь соответствующей модификации уже существующих таблиц иерархической классификации, что придает ей все более условный характер.
Критерий, определяющий число возможных группировок для N классификационных атрибутов, характеризует количество подмножеств атрибутов, которые могут быть использованы для формирования класса. В случае иерархической классификации с зафиксированной последовательностью атрибутов значение критерия равно числу уровней классификационного дерева, а в случае фасетной классификации — сумме сочетаний из N атрибутов по одному, двум, трем и так далее до N.
Критерии | Иерархическая | Фасетная |
Структура | Жесткая, задается фиксированной последовательностью классификационных признаков | Учитывает все многообразие сочетаний классификационных признаков |
Механизм построения | Простой, строго фиксированный | Сложный |
Число возможных группировок для Nклассификационных атрибутов | N(для зафиксированной последовательности классификационных атрибутов) | N i ΣСN i=1 |
Возможность группировать объекты по заранее не предусмотренным сочетаниям признаков | Отсутствует | Присутствует |
Внесение изменений | Жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки | Возможна простая модификация всей системы классификации без изменения структуры существующих группировок |
Многоаспектное описание документов | Невозможно | Возможно |
Информационный поиск по любому сочетанию атрибутов | Не предусмотрен | Предусмотрен |
Механизм пересмотра классификации (изменение состава атрибутов, добавление новых значений) | Требует перестройки всей классификации | Требует добавления новых классов (ранее построенные классы не меняются) |
Пригодность для каталогов и указателей, имеющих любую физическую форму | Пригодна | Непригодна |
Расход квалифицированного труда | Не требует применения высококвалифицированного труда | Требует применения высококвалифицированного труда |
studfiles.net
Классификация — это… Что такое Классификация?
Классификация (классифицирование) (от лат. classis — разряд и лат. facere — делать) — «особый случай применения логической операции деления объема понятия, представляющий собой некоторую совокупность делений (деление некоторого класса на виды, деление этих видов и т. д.)»[1].
«Классификация — это осмысленный порядок вещей, явлений, разделение их на разновидности согласно каким-либо важным признакам.»[2]
Классификация предназначена для постоянного использования в какой-либо науке или области практической деятельности (например, классификация животных и растений). Обычно в качестве основания деления в классификации выбирают признаки, существенные для данных предметов. В этом случае классификация (называемая естественной) выявляет существенные сходства и различия между предметами и имеет познавательное значение. В других случаях, когда цель классификации состоит лишь в систематизации предметов, в качестве основания выбираются признаки, удобные для этой цели, но несущественные для самих предметов (например, алфавитные каталоги). Такие классификации называют искусственными.
Наиболее ценными являются классификации, основанные на познании законов связи между видами, перехода от одного вида к другому в процессе развития (такова, например, классификация химических элементов, созданная Менделеевым).
Классификация по существенным признакам называется типологией; она основана на понятии типа, как единицы расчленения изучаемой реальности, конкретной идеальной модели исторически развивающихся объектов (биологические, языковые и т. п. типологии).
Всякая классификация является результатом некоторого огрубления действительных граней между видами, ибо они всегда условны и относительны. С развитием знаний происходит уточнение и изменение классификаций.
Делением называется раскрытие объема известного понятия; оно происходит путем перечисления всех видов (то есть меньших по объему понятий), входящих в состав делимого понятия. Отсюда ясно, что разделены могут быть только общие понятия, охватывающие собой различные части; ясно также, что для деления необходимо иметь основание или принцип (principium divisionis), делающий возможным правильное перечисление полученных благодаря делению членов его (parles divisionis).
От правильного деления требуется:
- полнота деления: все члены деления должны быть перечислены;
- чистота: члены деления не являются пересекающимися понятиями.
Основанием для деления может служить любой признак делимого понятия. Пользуясь признаком как принципом деления можно, при посредстве закона противоречия, всегда получить чистое двухчленное деление (дихотомию), например делить предметы на неорганические и органические, и т. д. Все сказанное имеет полное применение к классификации.
Когда исследователь имеет перед собой сложный ряд однородных явлений, то он:
- должен их расположить в известном порядке, удобном для исследования;
- должен сгруппировать сходные явления и отличить их от тех, которые только кажутся сходными с ними, в действительности же отличны от них;
- должен расположить эти группы в таком порядке, чтобы степень сродства их и взаимной зависимости выражались бы в самом расположении.
Классифицируя явления, их можно делить на группы, эти группы вновь подразделять и т. д.; например, понятие царства (хотя бы животных) можно разделить на классы, классы на роды, роды на виды, виды на подвиды и т. д. Исследователь, производя это деление, может иметь в виду различные цели, объективные или субъективные, причем и характер классификации зависит от ее цели.
Примеры классификаций
Правила классифицирования (деления объёма понятия)
- В одной и той же классификации необходимо применять одно основание.
- Объём членов классификации должен равняться объёму классифицируемого класса.
- Члены классификации должны взаимно исключать друг друга.
- Подразделение на подклассы должно быть непрерывным[3].
См. также
Ссылки
Примечания
dic.academic.ru
Основы классификации (объектов)
Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 9 классы | Планирование уроков на учебный год | Основы классификации (объектов)
Изучив эту тему, вы узнаете:
— что такое классы и подклассы;
— что такое основание для классификации;
— что такое наследование свойств;
— для чего нужна классификация;
— как проводить классификацию разнообразных объектов;
— как классифицируются компьютерные документы.
Классы и классификация
Человеку присуща способность обобщать и упорядочивать все многообразие объектов. Каждое имя существительное отражает представление человека об обширной группе объектов: дом, стол, книга. Объекты одной группы обладают общими для всей группы характеристиками, а также некоторыми чертами, позволяющими отличить их от других объектов.
Человеку свойственно отождествлять несколько объектов, родственных по какому-то признаку, рассматривая их как самостоятельный объект.
Например, про скрипку, виолончель, альт, контрабас, флейту, гобой, фагот, трубу мы говорим, что это «музыкальные инструменты». Видя на столе чашки, блюдца, сахарницу, чайник, называем это общим словом «посуда». У этих групп объектов существуют некоторые общие свойства, на них можно одинаково воздействовать для получения определенного результата. Обычно они существуют в одной среде. Такие группы объектов получили название «класс».
Класс — группа объектов с одинаковым набором характеристик.
Объекты, входящие в класс, называются экземплярами класса. Необходимо понять, что объекты, которые вы по каким-то параметрам объединили в класс с общим названием, отличаются друг от друга конкретными значениями параметров. Например, мячи, сохраняя основные свойства данного класса объектов (легкость, упругость), могут различаться материалом (каучуковые, резиновые, кожаные), цветом, размером. Птицами называют орла и курицу, страуса и колибри. Даже внутри узкого класса экземпляры могут сильно различаться: среди крылатых насекомых под названием «пчелы» существует матки, трутни, рабочие пчелы. В этом проявляется важное свойство классов — многообразие экземпляров, входящих в класс. Эти различия позволяют выделять внутри классов более узкие группы — подклассы, то есть проводить классификацию объектов в окружающем мире.
Классификация — распределение объектов на классы и подклассы на основании общих признаков.
Результаты классификации принято отображать в виде иерархической (древовидной) схемы. Общий вид такой схемы изображен на рисунке 9.1.
Внешне схема классификации напоминает перевернутое дерево, за что и получила название иерархической (древовидной). Пунктирными линиями на схеме выделены уровни иерархии. Самый верхний уровень (корень дерева) задает основные признаки, позволяющие отличить объекты данного класса от других. Каждый следующий нижестоящий уровень выделяет из вышестоящего группы объектов на основании совпадения одного или нескольких признаков. На нижнем уровне располагаются конкретные экземпляры выделенных подклассов.
С подобными схемами вы, возможно, уже встречались при изучении биологии, истории и других предметов.
Рис. 9.1. Общий вид иерархической схемы
В виде такой схемы часто изображают родословную. Ее принято называть генеалогическим древом.
Родословная — перечень поколений одного рода, устанавливающий происхождение и степени родства.
Основание классификации
С известными примерами классификации вы уже знакомы. Например, в биологии это классификация растений и животных. С глубокой древности люди, знакомясь с многообразием форм жизни на Земле, стремились распределить это многообразие по группам. Так сложилась естественная классификация, основанная на наблюдении и группировке по некоторым признакам. Идеи, изложенные в книге К. Линнея «Виды растений», изданной в 1753 году, до сих пор служат исходной точкой йри класси- фикации растений. С того времени используется и двойное название растений: первая часть имени указывает на подкласс (семейство), а вторая — на конкретные особенности экземпляра этого подкласса. Например, название Citrus limon указывает, что речь идет о семействе цитрусовых, а конкретно — о лимонном дереве.
Классификации поддаются не только природные, но и искусственные объекты: в грамматике принято разделение слов по частям речи, в физике — классификация видов движения, в математике — классификация чисел. В их основе лежит группировка объектов по одному или нескольким намеренно выбранным признакам. В разных отраслях науки и техники классы и подклассы могут иметь свои специфические названия: виды, семейства, отделы, разряды, группы и т. п. При этом суть их не меняется.
Рассмотрим объект «книга». Под этим словом мы подразумеваем множество разнообразных книг: художественных и технических, разных авторов, разной стоимости, толстых и тонких, в подарочном издании и в мягкой обложке…
А теперь представьте, что вам необходимо разложить все это многообразие «по полочкам» в буквальном смысле слова, например упорядочить свою библиотеку.
Каждый подойдет к этому вопросу по-разному. Один человек расставит все книги в алфавитном порядке, по фамилии автора. Другой разделит их на жанры: детективы, фантастика, приключения, любовные или исторические романы. Третий поместит их на полки, руководствуясь цветом переплета и размером книг (наверняка вы сталкивались и с таким подходом). Несмотря на разницу в способах классификации, все эти примеры роднит нечто общее: подразделение объектов на «родственные» группы (классы), для которых существует один или несколько общих параметров.
Во всех приведенных примерах при группировке был выбран общий признак: в первом случае это автор, во втором — жанр, в третьем — цвет и размер. Именно по этим признакам затем производилось выделение из общей массы тех объектов, у которых его значение совпадает.
Таких общих признаков может быть несколько. Они являются основанием классификации. Выбрав основание, из класса с общим названием «книга» можно выделить подклассы: «книга определенного автора», «книга определенного жанра», «книга определенного размера».
Классификация — творческий процесс, поэтому у каждого человека может получиться своя схема. Один из возможных вариантов выделения подклассов из класса книг показан на рисунке 9.2.
Рис. 9.2. Классификация книг
На первом уровне за основу разбиения книг на две группы выбран признак «вымысел» (да, нет). По этому признаку произошло разделение на художественную и техническую литературу.
На втором уровне признак выделения подклассов можно было бы назвать «форма подачи информации» (художественная проза, поэзия, словари и т. д.).
Третий уровень разбиения можно охарактеризовать признаком «стиль изложения».
Четвертый уровень классификации выделен только для романов, чтобы не загромождать схему. Признаком этого уровня выбран «жанр».
На самом нижнем уровне находятся конкретные экземпляры разнообразных книг.
Наследование свойств
Важнейшим свойством классов является наследование. Это слово вам хорошо знакомо. Дети наследуют от родителей черты характера и внешние признаки. Каждый подкласс, выделяющийся из класса, наследует свойства и действия, присущие этому классу. В приведенном на рисунке 9.2 примере и роман Д. С. Мережковского, и все другие изданные романы, и вся художественная литература вообще — наследуют от класса «книга» общие свойства и действия. Все они напечатаны на бумаге, переплетены и предназначены для чтения.
Из приведенной выше классификации видно, что образовалась иерархическая структура (дерево). Во главе ее класс-пра- родитель — «книга». В самом основании экземпляры подклассов — конкретные книги конкретных авторов.
Такая древовидная структура с общим корнем называется «иерархией наследования». Характеристики и поведение, связанные с экземплярами определенного класса, становятся доступны любому классу, расположенному ниже в иерархическом дереве.
Утверждая, что «книга — источник знаний», вы подразумеваете как все книги вообще, так и конкретную книгу, например «О вкусной и здоровой пище». В этом проявляется наследование.
Для чего же нужна классификация?
□ Классификация позволяет выделить из всего многообразия объектов группы с интересующими исследователя свойствами и сосредоточиться на их изучении.
Предположим, что вы — неопытный огородник, но хотите, используя достижения науки, выращивать на своем участке хорошие урожаи помидоров. Вам незачем штудировать толстый том «Растениеводство», достаточно прочесть книги о семействе пасленовых, а еще лучше — об особенностях выращивания помидоров в вашей местности.
□ Классификация объектов проводится с целью установления наследственных связей между объектами. Свойство наследования позволяет изучать характеристики всех объектов класса, не привязываясь к конкретному экземпляру.
В геологии существует «теория единообразных изменений», которая гласит, что все природные факторы действуют повсюду одинаково. Не надо изучать, как действуют ветры на Уральские горы, так как механизм разрушения гор под воздействием ветров давно исследован, он един для всех случаев. То же относится к землетрясениям, вулканам, наводнениям, селям и т. п.
□ Классификация позволяет систематизировать знания об объектах любой природы и назначения.
Иллюстрацией этого утверждения служит то, что нет ни одной школьной дисциплины, в которой не использовалась бы классификация объектов изучения как средство обобщения информации, получаемой на уроках. Откройте любой учебник и убедитесь в этом.
Примеры классификации различных объектов
Исследуя один и тот же объект с разными целями, можно увидеть его различные грани. Например, врач, описывая конкретного человека, сделает акцент на симптомах возможной болезни.
Психолога заинтересуют черты характера и особенности психики. Социальные службы обратят внимание на возраст, наличие родственников, условия жизни. Поэтому одни и те же объекты можно классифицировать по-разному, выбрав те или иные основания. Вы уже столкнулись в учебнике с примерами различных классификаций. Например, изучая раздел 1, вы классифицируете информацию по разным признакам: по способу восприятия и по форме представления.
На рисунке 9.3 приведен еще один пример классификации информации — по содержанию.
Рис. 9.3. Классификация информации по содержанию
В этой классификации на основании признака «содержание» на первом уровне выделены следующие группы информации:
♦ статистическая — показатели развития производства и общества;
♦ коммерческая — наиболее важные сведения о производственных, торговых и финансовых операциях;
♦ экологическая — сведения о состоянии окружающей среды и влиянии деятельности человека на природу;
♦ политическая — информация о деятельности государственной власти, общественных движений и партий;
♦ другая (демографическая, медицинская и т. д.).
Все выделенные подклассы характеризуются теми же свойствами (ясность, полнота, актуальность и т. п.) и действиями (обмен, хранение, обработка), что и вышестоящий класс «информация».
Приведем еще один пример классификации, касающейся наиболее значимых систем (рисунок 9.4).
В качестве основания для классификации на первом уровне выбрано участие человека в создании системы (естественные и искусственные).
На втором уровне основанием для классификации был выбран признак «сфера жизнедеятельности человека». Здесь выделены такие подклассы систем:
♦ духовные у касающиеся духовной жизни человека;
♦ технологические у связанные с производственной деятельностью человека;
♦ организационные у обеспечивающие обслуживание всех видов деятельности.
Рис. 9.4. Классификация наиболее значимых систем
На схеме не показано дальнейшее разветвление дерева, так как это сделало бы рисунок громоздким. Но подразумевается, что дальнейшее выделение подклассов возможно. Например, рассматривая класс систем, называемых «Искусство», можно было выделить следующие подклассы по средствам воплощения замыслов авторов: Живопись, Скульптура, Архитектура, Литература, Театр, Музыка, Кино и т. д.
Наряду с устоявшимися и общепризнанными классификациями имеет право существовать любая классификация объектов, если за ее основу взят характерный признак и соблюдены правила выделения классов и подклассов. На рисунке 9.5 приведен пример классификации используемых в реальной жизни и встречающихся в сказках средств передвижения.
Здесь на нулевом уровне расположен класс объектов с общим названием «средства передвижения».
На первом уровне выделено два подкласса по признаку «реальность» (существуют в реальной жизни или в сказках, фантазиях).
Рис. 9.5. Классификация средств передвижения
Второй уровень выделяет из реальных и сказочных средств передвижения новые подгруппы по признаку «среда передвижения».
Третий уровень делит реальные средства передвижения на подгруппы по признаку «вид транспортйого средства». На схеме не указано выделение подгрупп из реальных наземных средств передвижения, чтобы не загромождать ее. Но эти группы могли быть следующими: рельсовые, дорожные. Возможно и дальнейшее подразделение. Важно понять, что нижние уровни наследуют все характерные признаки, свойственные более высоким уровням: например, объект Ка-26, принадлежащий к подклассу вертолетов, наследует от вышестоящего уровня среду перемещения (воздух), а также является реальным средством передвижения со всеми сопутствующими признаками (существует в реальной жизни, осуществляет перевозки людей и грузов).
Классификация компьютерных документов
В самом общем смысле компьютер можно назвать инструментом для обработки информации. Для этого существует множество разнообразных программных сред. Разработчики постоянно совершенствуют программы, упрощая работу с ними и предусматривая в них новые возможности.
Чтобы не «утонуть» в море программных продуктов, пользователь очень хорошо должен представлять, с какой информацией ему предстоит работать. Каждая программная среда предназначена для создания документов определенного вида.
На практических занятиях вы уже познакомились со многими видами компьютерных документов, которые будут упоминаться при классификации документов.
Приведенная на рисунке 9.6 схема показывает классификацию, в которой в качестве основания выбран признак «назначение документа». Основным назначением компьютерных документов является представление информации в удобном для пользователя виде. В таблице 9.1 дана более конкретная характеристика каждого класса документов.
Рис. 9.6. Классификация компьютерных документов
Обратите внимание, что название среды, как правило, совпадает с видом документа и формой представленной в нем информации.
Приведенная классификация поможет вам выбрать среду в соответствии с предполагаемой формой представления информации.
В настоящее время документы, используемые в различных областях человеческой деятельности, создаются на компьютере. Рассмотрим примеры документов различного назначения и сферы применения.
Литературное произведение, газетная статья, приказ — примеры текстовых документов.
Рисунки, чертежи, схемы — это графические документы.
Таблица 9.1. Виды компьютерных документов
Бухгалтер на предприятии представляет в табличном виде данные для расчета зарплаты сотрудников. Основная особенность электронных таблиц состоит в том, что они позволяют не только представлять информацию в табличной форме, но и производить автоматические вычисления по формулам, связывающим ячейки таблицы.
Один из видов компьютерных документов — база данных. Она представляет собой совокупность упорядоченных сведений об объектах. В обычной жизни вы не раз встречались с базами данных. Это и картотека с названиями книг в библиотеке, и телефонный справочник, и каталог товаров. В настоящее время вместо обычных «бумажных» баз данных повсеместно создаются компьютерные, представленные документами соответствующего вида. Диспетчер справочной службы имеет в своем распоряжении всеобъемлющую компьютерную базу данных, позволяющую ответить на любой ваш вопрос. Система управления базой данных обеспечивает быстрый поиск интересующей вас информации.
Текст, графика, таблица, база данных — это примеры документов, в которых представлена информация какого-то одного вида.
Однако наиболее часто мы имеем дело с составными документами, в которых информация присутствует в разных формах. Такие документы могут содержать и текст, и формулы, и рисунки, и таблицы, и многое другое. Школьные учебники, журналы, газеты — это хорошо знакомые всем примеры составных документов.
Для создания составных документов используются программные среды, в которых предусмотрена возможность представлять информацию в разных формах.
Развитие программного обеспечения привело к тому, что в настоящее время появились новые виды компьютерных документов. В частности, это презентации и гипертекстовые документы.
Презентация представляет собой совокупность компьютерных слайдов. Специальная программа обеспечивает не только подготовку информации, но и показ ее по заранее созданному сценарию.
Гипертекст — это документ, который содержит так называемые гиперссылки на другие части документа или другие файлы, где содержится дополнительная информация.
Контрольные вопросы и задания
1. Для чего нужно классифицировать объекты?
2. Что лежит в основе любой классификации?
3. Приведите пример классификации объектов по общим свойствам.
4. Приведите пример классификации объектов по общим действиям.
5. Может ли среда существования стать основанием классификации?
6. Произведите классификацию объектов с общим названием «велосипед».
7. Классифицируйте домашнюю посуду по следующим признакам: материал, назначение, долговечность.
8. Предложите несколько вариантов упорядочения (классификации) разнообразных объектов на вашем письменном столе.
9. Назовите основание, по которому в одну группу могли бы попасть следующие объекты:
■ кенгуру, утконос, кролик, броненосец;
■ роза, колесо, футбольные бутсы, кактус;
■ молоко, бензин, кислота, магма.
10. Назовите разнородные объекты окружающего мира, которые вошли бы в одну группу по основанию «одно вещество».
11. Какие классификации используют в вашей школьной среде?
12. Перечислите наиболее распространенные группы компьютерных документов.
13. Приведите примеры классов программных продуктов. Какое можно выбрать для этого основание классификации?
14. Какое основание классификации можно использовать для выделения групп аппаратной части компьютера?
15. Какие вы знаете классы памяти компьютера?
xn—-7sbbfb7a7aej.xn--p1ai
Классификатор
Под классификатором понимается перечень объектов, которые упорядочиваются по тому или иному признаку – в результате каждому из объектов присваивается уникальный код. Многие классификаторы имеют иерархическую структуру и активно используются при составлении финансовой документации и в работе автоматизированных систем.
Пример классификатора и работы по нему
Попробуем определить код классификатора организационно-правовых форм предприятий. Такой классификатор называется ОКОПФ (сокращение по первым буквам). Допустим, нам нужно выяснить классификатор закрытого акционерного общества. Работать с классификаторами, к слову, можно на сайте www.classificators.ru – здесь есть вся необходимая информация.
Следуем по алгоритму:
- 1. Выбираем классификатор ОКОПФ и видим перечень первого уровня:
Отмечаем для себя, что код классификатора 5-значный. Следовательно, долгих поисков не будет.
- Так как ЗАО – это юридическое лицо и коммерческая организация, необходимо выбирать первый пункт. Код классификатора будет начинаться с единицы. После выбора видим перечень второго уровня:
- Находим пункт «Акционерные общества» и заходим в подменю. Код обретает вид 1 22. Видим следующее:
Теперь нам известно, что код классификатора ЗАО – 1 22 67. Именно этот шифр можно использовать в финансовой документации для сокращения, не боясь остаться непонятым.
Весь пройденный путь можно упрощенно представить в виде следующей иерархической схемы:
Остальные классификаторы построены схожим образом.
Методы классификации
Выделяют два основных метода классификации:
По иерархическому методу мы считали вышеизложенный пример. Иерархический метод предполагает деление множества на подмножества и конкретизацию объекта с каждой новой операцией. К иерархическому методу классификации установлено несколько требований:
- Не должно быть понятий, входящих одновременно в несколько подмножеств одного уровня.
- Не должно быть лишних понятий, то есть тех, которые не подходят ни одному подмножеству.
- Каждое подмножество использует лишь один признак.
Преимуществом такого метода является простая и общепринятая кодировка, а недостатком – неповоротливость (включение новых элементов в классификатор всегда создает проблему).
Фасетный же метод предлагает делить множество на несколько независимых друг от друга классов – фасетов. При этом каждый элемент множества является составляющей лишь одного фасета. Основное преимущество метода – гибкость (состав фасетов можно легко менять), основные недостатки – нетрадиционность (иерархические коды попросту привычнее) и недостаточность дискретизации (фасеты не делятся на подмножества и остаются достаточно крупными группами).
Структура классификатора и методы кодирования
Понять структуру классификатора несложно, ведь состоит она всего из двух измерений: глубины и емкости. Под глубиной понимается количество ступеней иерархии классификатора, под емкостью – количество элементов, расположенных на одной ступени. Такой способ представления позволяет расположить любой классификатор в системе координат:
Соотношение глубины и емкости элемента или подмножества классификатора определяется кодом. При этом кодирование – тоже неоднозначный процесс. Существует несколько способов кодирования элементов классификатора:
Так, регистрационные системы кодирования предполагают закрепление за объектом натурального числа без разделения на подмножества. Такие системы кодирования — самые простые и примитивные. Различают два вида регистрационных систем:
- 1. Порядковая. Объекту просто присваивается натуральное число. Можно рассмотреть пример банковской отчетности:
Отчетность банка |
Код |
Ежедневная |
01 |
Ежемесячная |
02 |
Ежеквартальная |
03 |
Ежегодная |
04 |
- 2. Серийно-порядковая. Объекты объединяются в группы по тому или иному общему признаку, но в иерархию не выстраиваются. Рассмотрим пример со странами:
Европа |
01-56 |
Албания |
01 |
Великобритания |
20 |
||
Азия |
57-108 |
Таиланд |
88 |
Монголия |
62 |
||
Северная Америка |
109-125 |
США |
120 |
Панама |
118 |
||
Южная Америка |
125-136 |
Боливия |
127 |
Аргентина |
126 |
Главное преимущество порядковых систем – простота. Если возникает необходимость добавить новый элемент, он просто вносится в конец перечня.
Классификационные системы же, напротив, образуют иерархию:
- 1. Последовательные. Множество делится на подмножества, подмножество – на более мелкие субэлементы: при каждом новом делении код «цепляет» дополнительное число. Схему последовательной классификации можно представить следующим образом:
Пример классификации организационно-правовых форм, приведенный в начале статьи, рассчитан по последовательной системе.
Коды, выстроенные таким образом, легко понимать, однако, саму систему при необходимости добавить новый элемент перестроить очень сложно – это и есть ее минус.
- 2. Параллельные. Такой метод используется чаще всего при фасетном способе классифицирования. Код складывается не из дискретизации подмножеств, а из совокупности свойств объекта:
Нашим примером будет одежда. Допустим, имеются следующие признаки: зимняя одежда – 02, женская – 15, одежда из Китая – 27. Таким образом, женское зимнее пальто из Китая будет иметь кодировку 2 15 27.
utmagazine.ru